Skip to content

单因素方差分析分析

零假设

Ho 假设:

H0:μ1=μ2==μk
  • μ1μk 代表 k 个组的总体均值

示例:

比较 4 种肥料对作物产量的影响 H0: 肥料 A/B/C/D 组的平均产量完全相同

线性回归视角

模型假设

yij=μ+αi+ϵij,ϵijN(0,σ2)

其中:

  • yij:第 i 组中第 j 个观测
  • μ:总体平均水平
  • αi:第 i 组的效应(组偏差)
  • ϵij:随机误差
  • i:行
  • j:列

例如:

编号ABC
I432
II554
III653
IV765
IIV869
组平均654.2

分解变异(计算平方和)

总平方和(SST):所有数据与总体平均数 μ 的偏差

SST=i=13j=15(yijμ)2=(45.33)2++(95.33)2=54.67

组间平方差(SSB):组均值与 μ 的偏差(固定效应 ϵ

SSB=i=13ni(yi¯μ)2=5×(65.33)2++5×(55.33)2=5.33

组内平方和(SSE):组内数据 yij 与组均值 yi¯ 的偏差(反应随机误差 ϵij

SSE=i=13j=15(yijyi¯)

上述均满足:

SST=SSB+SSE

计算均方与 F 统计量

均方

来源平方和(SS)自由度(df)均方(MS = SS/df)
组间SSAk1MSA=SSA/(k1)
组内SSENkMSE=SSE/(Nk)
总体SST = SSA + SSEN1
总自由度=组间自由度+组内自由度N1=(k1)+(Nk)

F 统计量

F=MSAMSE

ANOVA 表标准格式

变异来源自由度 (df)平方和 (SS)均方 (MS = SS/df)F 值
组间(因素A)k1SSAMSA=SSAk1F=MSAMSE
组内(误差)NkSSEMSE=SSENk
总体N1SST = SSA + SSE

结论

要根据 F 分布密度曲线来下结论,一般来说是右侧单尾检验:

图片来源:https://blog.sciencenet.cn/blog-292361-1101359.html

如果落在右侧,即否定原假设,认为不完全相同,有可能犯第一类错误,概率为 α

如果落在左侧,即认可原假设,可以认为这两组完全相同,有可能犯第二类错误

快速计算公式

校正因子(CT)

CT=T2n=(Tn)2×(n)=n×μ2

总平方和(SST)

将每个样本平方,然后减去校正因子(CT),得到所有数据和平均数的偏差

SST=y2CT

组间平方差(SSB)

SSB=Ti2nCT

同理,可以将 Ti2n 进行变形:

Ti2n=(Tin)2×n=(组间平均数)2×ni

组内平方差(SSE)

SSE=SSTSSB

最后更新于:

Released under the MIT License.